



 
!!"
"#
$%&'(&&&'(&)*()
+%&%(&%
,-./0..&-/1..#233
4*-./..-/5%..#333
6(&7&7&((&&*&
%%&+&%&'(&
89*-.+7*(&*,:;
&'&%%&'(&%&<,:%
<&(%&*7*&&
%&'(&)+
.9*(%7&(&;+&%&'(&
9*(%&(&;+&%&'(&
==
>&&%)&
*&;&&7&&&%
(%7
=/>%&)&%**&
)%7&(&
/!%*+())'*)?
&&)&77&
'(%(*'&5%?
*'%@;(('7A""&'%)
%)%)*
A'/
%&%&)
'7&&%&&7
)%&7&
B /C%/
/!&/
/!DD/
-7/ %)*&&
**
EB /E7("'(("'%
;)((*'((
B A7
B=/3&7B(
7'.>&*B**(*&7
%&&7(*&7
%*=>&B*=(
&&&&7

F%2*7B/9D;>;%
G&D);
97B%%73&
)%'*&)&D
2%/
 %2%9HF
I;;J";*"0&&%
A> #core pts/
border pts/()%%
FNoise pts
33K?*&((&
'%'(
F33K ?*%(&'
((
>LF29%)3FF&&
7)''7&*&&
=%0.,7;%.,%);%1.,(
(& /F%;%3
 (&/!;
A&9(/>%*#+7*';
()*
A'/
F%2*7
Data Leakage
9%737)*%
9%733
*M'%
#(*%
%7'N%D7
&&%')NL7**%%*&%
$ED7%7(7#72%&%)
('7>(('7((7&5%&
%&'&7)%&
Detecting Data Leakage:
9*(*'7
&D*&7&)*%7)%7C>O
>*7**%7&'&'
Fixing Data Leakage:
C"7'7*%%7*%77
L7
>(('(7('%)
$;%%**(%7**%%
Making Model Robust to Outliers
mAP Mean Average Precision
E7EF7
!%')&D%7'*&
*%*%&&7&>
)%))'%7F7%JEE
3&*%%(&7/
E'/3&&()&*P
-'/3&*%&*'%*
9(/2)(*&&
'/'*"%*;P')%
9M'(%(%&%*
&*%G&*M&(%%&
%*&*%
>+%F5F5&)>+
F5D%&)E7>+F57
%((=!&=!
%)'()*&'((&&
'((!7!"J7
3&(&%7&&&&7"J7((&%7&
%((
Goal is to increase the margin.
Works fine for large datasets.
Also when features> data points.
Non-Linear Data also using Kernel Trick.
x- Wrong choice of kernel.
x- Extremely slow in test phase.
x- Complexity more.
22F*&;*2>
2>&%&*%7)'*
7&*%*
A'*)/Q)%;7R
A'*)/)%Q;7R
A'*)/7Q;)%R
=!%*&
E7(7&%7*'7(
)?)
>7)&)%
3
9*M/('*&)%)*(7%&
('*(79&%**7*D7
&%*)%
M(%'C('%7&
&((*%)5%(
M(%'%)%&())'**'7)
M(%'.0);.,0
Gradient Boosted Vs Decision Trees
K-Means ALgo
E/
%7%7(*%;)%&'5%
D7&J;&&()%'
(&7''J
39%(**5%&*5%'7
&())'**7"&%*5%'
&%*&&&%
9%&*5%&&
(%ST(
3&&*5%"
(*&(%
F7%J/
EE/%&*&7%J;&
%*7&)%%&
%D&7&(
3&*;%*75%"
(2%&&***&
%***%(%9)&%7&*
)&5%&7
>%7
$C'((7&(*&77
;'(&7&
GD&!&';&;>*%*&(
U(&FEL*%
**)%.;)%&('&.
*7%*(%3&T&'&FEL*%
 E
>7(7&&%&7&"(7"
&(*%D7
7%%'**&7*&(%)&
7J3&%&(%J
=&7M/)'%7%;)&J
C"(7M/)'7((7;"J;
7&(*%)3&''
&&2'&D)%77&&
&'&((9*(7)7*%;
&'((*%7)
Multicolinearity :
!%'')()-;
%'())%&*&
**D&'
&7&The result is that the coefficient estimates are
unstable and difficult to interpret!%'(&
(*&';%&**&7;
D**%(*'&
=9*/
=**7*%(3&%%*=9
'%*&(7&&
5%**&**"(;=9*<'%&
&*(%**<.:)77&&'%%
"(*&%'V*&&&
(

A,'
M&,&7&'
E3&
A=3**
Normal Distribution Properties
Resampling
Types of Biases :
A#((*&((%
L7))*&((%5%'
)%
%&()7**%7(&%((
%7(%'D7&&
D)%*&D*(;
C"%7'%D+%&%)%;7
&&'(*7('-;&'(*)&&;
&&*;&%)7*&
G&'JN
C"(G7&>7
M&% F!(
>M&%KF!(
A& JN
*"%
Principal Component Analysis :
- Dimensionally Reduction while retaining the existing variance in dataset.
- transforming the variables to a new set of variables, which are known
as the principal components.
- Principal components are the eigenvectors of a covariance matrix, and
hence they are orthogonal.
- Eigen vector of a matrix A is a vector represented by a matrix X such
that when X is multiplied with matrix A, then the direction of the resultant
matrix remains same as vector X.
SVM Hard Vs Soft
-97E%
3&*7&*7*%;&&%%
&;'&%(%*&*
'".;W '
2%(.,0'".;W .,.,
2%.(.,0'".;W .
Gini Index Calc
Entropy Calc
2%3
&7&
J&*%;&77&)%)%&7&%
E7*&*%&'%
$(&%
,&5%%*&
BC)%/G&%%*5%=%
B C)%/C=%
Cross Validation for Time Series data
!G7&/
9J.#;%'(**%
F'J.
RNN- Recurrent Neural Network
F 7D*(%&(J
E3!/
3&%7'*&DVD&
3&%(%&(%(VD&(%&
3&(%&%(
&7'(E3!?*77;(%7%(%7
7M/&&)*&7'*&
D%*%7)&&(%&(%
3&;&(%&&(%*
%D&7%(%
 !' D/&(%&(%
7S'%(T
9(%M/*'&&(*&S'T&
73&D%(%*%Q.;R
$2%(%M
Autoencoders :
>%%DL%(!&7
7&&(()D((7;7&7%)5%
&(%>%%%&J*%(%
(9*'&7;&'%
*&(
9*'F%;->%***>N
>%*&
*%%('
9T&'9%%'
&&)*;7
9**'&%&&
&%7*&>
>%((*&'&%(%
9D%*('*&(('*
7&&
Image Coloring/')D&(%7(7
&&(%;()&&&%)
Feature variation:C"'&5%*%*77&
%(%)'7'%'%(
Dimensionality Reduction: 3&%7&%(%)%&
%9&((77&%("%
Denoising Image:3&(%)'&%&(%)%
&'%(>7%&%%
&7(%*&'
C/3&(*&D(&(%((
3&'&(%7((%
3&(7&*&77
/F(&((%&&*&;&&(*
)*&()
/&7)D&73&7
'%*&77%*&(
EF7/
1. Regression Coefficient :
2. Intercept (or β0):
3. Error Terms or Residuals (ϵ):
EF7(/
EMC5%/
%/Σ(%
**&*%
.

$M
,G7&L(
Building a Linear Model
Residual Analysis
F!C'%&!C%&(**&7
&&&&%&()
!C**)*%&D'(*&(
(**)*%D!>C
!>)%C!>C**)("(&(7
%5%%7%9'*(7%5%
%7%*(&7&&
&7
3&%*!>C;!C;F!C(&7&%'*7
-;&7&%*F5%)
3&F!C&7(&%*(
))%&F5%&&()
"(&&()
!C'))%&!>C;&5%7*&*
&7&(%
G&'EF7***N
3&*&EF7&%%%&
*()%
3&()77&&*&&%&(

MSE vs RMSE vs MAE vs R
2
vs Adj. R
2
G&'%77&&'7N
9*'%%7;&(%)7&
&J*'%*%7&&"%&%&'
)
2*&%(*EF&&*P%*
&'3&)&&)')G&,.(*
&((;&&,;"%%>
"%;&G&.;&X<.<;
((&J;&((&J
3&7*7*&YZ)YZ7&%(&%(&*
(PP@')%A%P'D&%.;&
%(('&+%*';(("'3&*;&*&
77&%(*'%%7&)'=
LOGITS:
(*&&7&E@'&&())'*)77
&7&<.3&&*)7%) .<.<.<.<
'2*)7....<<.
3&''%((7;)%&*)7&%)&((*&
*)7*GD*&''&%7&&%7&;
2*!<6
2*)7.6
&7*)7"'((&7*)7*
977;&()7;&&&%7*&;&;
77**%*
7K);&77%)';%()
&@'7&&G%&''7&7
%=;)%*%;@&7&;&.
E7))/
7K)
3'(*)%/
 Bernoulli Distribution:>A%)%&'()%;
'%.*%;7
3&())'*%7)'/(
"
(
"
&"[.;
Uniform Distribution: G&'%*;&%43&
())*77&%5%'D'&&)*
%*)%LDA%)%;&%)*()%
*%*)%5%'D'
Binomial Distribution:
(
5

(%;5*;;*(*%
C&(
3&'()%&%*%
>%)*%
3&())'*%*%*3
$Normal Distribution:
3&;*&)%
3&%*&)%)&(')%&"\
3&%&%
C"'&**&%&**&&&&*&7&
,Poisson Distribution:
)%(()%&%(*
(&%'&%)*%*&
]&&&%;
&7&*;
0^]X
>&%)*&
4Exponential Distribution:
C"()%&*)&;7&*)
!;**>C"()%'%*%'
&"(**&&"(**&%
&(]0.&&&
How IQR used in Time Series?
9HF%3>_%_(&,&
9H%F79HF*&H%&!%%*&
3&H%&!"%
Data Preparation Operations in Time Series?
7**%%*
M75%**"*5%'(
!(%77&J*
F(77(%*5%'
*7&&)%
7G!&3
3&(%()%(%);&"(
)%&%(%)
3&%)*(%(&&J*&7
Trend : -7&&&7&)
Cyclical: -"&"&)*&**"(
Seasonal: "&"&)7%*%%)&;
''**"D(
Irregularity: L"((D&(
'/
!=%&%)
=&%)*
!%**)((
Augmented Dickey-Fuller (ADF) Test or Unit Root Test:
Detrending:
97&***&7&7
'&**%*&'&'(
)*
1. Differencing:%&%(%&**)
&7)&)&(%(
%))
3&&&***7*
((&D*&
9*&5%&&7&;&
***&'**)D;*
**73&()*%&(*
L7E!/%)#(
Transformation/3&%&**&&'3*;
5%F;E73*;'%E73*
Auto-Correlation9%&7*&')7
&77*&**&)
3&%*'*&7&*%**
)%&%')%
>%F7!/3&(;&(*%%(*)(
(*'%**7;&&)%
7&%&(%)D*&
Moving Average Methodology
(!7>7%7&*&(%! (3&*
7(;(7&%*&7(*
7&%*! ;(&&7&"(*%'
%%!7>7%7&*(%;&%
C"(!7>7*'*%3&7&*
7%'3&977&(;&
(&!>;&C!>*&7
Decision Rules in Hypothesis Testing
>'%;*7$;&>**
7*'3&*;
%%7(*$
;%&*&
**%7&P%GD5%/
Akaike’s Information Criterion (AIC)
3&%*%*7&(;;5*>F9!>3&>9"(/
&&&>9(&
Ljung-Box Test
3&*(*7%'&%9';&%)
&;&%
>7'&%&E+%7A" &&')((&
F%
3&%&'(&*&E+%7A"&&%ED7&
(%);&&')..,3&*;+&%&'(&
&%
>F9!>!(;;5/
(&%)*%7;
&%)****';
5&%)*77*&(5%
General Time Series Modeling Procedure :
>>
HOG – Histogram of Oriented Gradients
G&'K&7N
-!D!/
.#E;(;&;5%*
/`;;;a
2)/`%;*%a
())'/`bU/.;bU/.;a
3))'/`bU/`bU/..;UU/.;a;bU/`bU/.;aa
C)/`bU/`b%/.;*/.<a;bU/`b%U/.;*/.6a?a
L7(&&((%')%
%
L73()(&)&"7
E&3"H%'M
/((&))
75%7"
>EF&7
-J&!99>J%7
D7
>*M